Evaluación de la Fragilidad Semántica en Sistemas de Generación de Texto a Audio bajo Perturbaciones Controladas de Prompts
Evaluamos la fragilidad semántica de sistemas TTS mediante perturbaciones controladas de prompts. Un estudio clave para entender la robustez de la síntesis de voz.